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基于 多 重 因素 的 个 性 化 学 习 推 荐 系统 
匡 容 , 杨 振 国 ， 刘 文 印 


(广东 工业 大 学 计算 机 学 院 ,， 广州 510006) 


摘 要 : 为 解决 现 有 学 习 推 荐 算法 中 存在 的 忽略 对 学 生 知 识 点 掌握 情况 的 分 析 、 不 能 将 知识 掌握 程度 概率 化 等 问题 ， 
提出 一 种 基于 多 重 因素 的 学 习 推 荐 方法 。 该 方法 综合 考虑 知识 点 的 综合 权重 、 错 误 率 和 失 分 率 多 个 因素 构建 知识 点 掌 
握 概 率 模 型 ,并 应 用 所 提出 的 策略 实现 一 个 在 线 的 个 性 化 学 习 推 荐 系统 。 系 统 评估 上 对 200 名 高 中 生 进 行 了 一 项 调查 ， 
本 系统 推荐 top-8 知识 点 的 准确 率 达 到 91.2%，F1 达到 78.4%6 。 系 统 调 查 的 结果 显示 了 提出 策略 的 有 效 性 和 可 靠 性 。 
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Multiple factors based personalized learning recommendation system 


Kuang Rong, Yang Zhenguo, Liu Wenyini 
(School of Computer Science &Technology Guanegdong University of Technology, Guangzhou 510006, China) 


Abstract: In order to solve the problems existing in the learning recommendation algorithm that ignore the analysis of the 
students' knowledge points and can not probabilize the knowledge mastery, this paper proposed a recommendation method based 
on multiple factors. The method focused on the comprehensive weight of knowledge points, error rate and loss rate, and built a 
knowledge point mastery probability model, and applied the proposed strategy to implement an online personalized learning 
recommendation System . In terms of the systematic evaluation, through a survey of 200 high school students, the accuracy of 
the top-8 knowledge points recommended by our system achieves significant performance, Precision: 91.2%, and Fl: 78.4%. 
The results of the systematic survey reflect the effectiveness and reliability of the proposed strategy. 
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进行 推荐 或 概率 矩阵 分 解 方法 0 将 学 生得 分 矩阵 分 解 成 一 组 
潜在 因子 ， 再 预测 目标 学 生 在 习题 上 的 得 分 进行 推荐 。 然 而 ， 
考试 最 早起 源 于 中 国 ， 是 学 校 检 测 知识 掌握 情况 的 重要 手 。” 认 知 诊断 方法 不 能 将 知识 掌握 程度 概率 化 ， 协 同 过 滤 方 法 和 概 
段 。 在 校 中 学 生 每 年 需要 面 对 大 量 的 考试 (课堂 测试 ， 周 考 、 率 矩 阵 分 解 方法 均 忽 略 了 对 学 生 知识 点 掌握 情况 的 分 析 023， 均 
月 考 等 ) 。 然 而 ， 在 实际 过 程 中 考试 检测 的 作用 未 得 到 充分 的 导致 推荐 效果 不 佳 。 因 此 ， 针 对 目前 中 学 的 教育 现状 ， 及 以 上 
利用 。 在 大 多 数 中 学 , 学 校 没 有 完善 的 成 绩 管理 系统 叫 , 大 多 以 ”算法 和 技术 的 不 足 ， 本 文 运用 基于 知识 点 综合 权重 、 错 误 率 和 
纸 质 成 绩 单 存 储 ， 学 生 的 历史 成 绩 难 以 查询 或 分 析 ; 一 个 教师 。” 失 分 率 的 多 重 因素 来 构建 学 生 知 识 点 掌握 概率 模型 ， 从 而 确定 
要 负责 上 百 个 学 生 ， 难 以 针对 每 个 学 生 的 测试 做 具体 分 析 ， 对 ”为 学 生 推 荐 的 知识 点 。 该 概率 模型 还 与 传统 的 认 知 诊断 方法 、 
学 生 学 习 效果 的 评价 缺乏 深入 地 挖掘 分 析 ; 大 部 分 学 生 因 自身 ”协同 过 滤 方 法 和 概率 矩阵 分 解 方法 进行 了 大 量 实验 对 比 ， 并 在 
知识 和 总 结 归纳 能 力 有 限 难 以 展开 深入 探究 ， 常 停留 在 成 绩 4 个 性 化 学 习 推荐 系统 得 到 实现 。 本 文 实现 的 个 性 化 学 习 推 荐 系 
数 。 如 何 最 大 程度 地 发 挥 测试 的 作用 ， 为 学 生 明确 知识 漏洞 是 。” 统 应 用 于 湖南 省 湘潭 县 一 中 高 三 年 级 数学 知识 点 的 分 析 中 , , 促 
本 文 关注 的 重点 。 使 学 校 更 好 地 开展 教学 工作 ,提高 教学 质量 [13]。 
随 着 互联 网 技术 的 不 断 发 展 外 ， 教 育 领域 涌现 出 很 多 前 沿 
技术 与 应 用 ， 如 数据 挖掘 技术 B]、 推 荐 系统 技术 内 、 昔 课 铝 、 网 
易 公 开课 外 等 ， 这 些 成 果 改变 了 传统 教学 模式 。 现 有 学 习 推 荐 在 众多 课程 中 ， 知 识 点 的 掌握 程度 是 衡量 学 生 知识 掌握 情 
工作 大 多 采用 认 知 诊断 模型 [引入 习题 知识 点 矩阵 、 协 同 过滤 。” 况 的 最 直接 的 标准 ， 知 识 点 能 反映 学 生 在 学 习 过 程 中 的 不 足 和 
方法 8 计算 相似 学 生 答题 记录 之 间 的 相似 度 ， 根 据 相 似 学 生 ”知识 漏洞 9。 因 此 ， 知 识 点 对 于 学 生 进行 针对 性 学 习 
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情况 进行 建 模 ， 获 得 知识 点 掌握 概率 模型 ， 用 # 
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5 在 知识 点 K, 上 的 推荐 度 ， 如 表 4 


佳 荐 指数 越 高 ， 越 值得 被 推荐 。 


表 2 学 生 考试 得 分 数据 


Table 2 Instances of test Scores 


最 重要 的 知识 漏洞 ， 有 效 地 提高 考试 表现 。 学 生成 绩 
表 1 知识 点 推荐 涉及 符号 及 描述 TI TT Ti T; Ti Tv 
Table 1 Notations 5 5 Ss 20 12 10 
符号 描述 Si 5 5 0 12 5 7 
S 学 生 集 合 S; 0 5 5 10 9 6 
S, 学 生 u 
了 试题 集合 Su 5 0 0 5 6 9 
7, 试题 v 表 3 试题 知识 点 关联 数据 
K 知识 点 集合 Table 3 Relation matrix of questions and knowledge points 
Ks 知识 点 n 试题 知识 点 关系 
G 学 生成 绩 和 矩阵 Ki Ko Ks 
gs 学 生 5 在 试题 的 得 分 情况 Ti 1 0 0 
O 试题 知识 点 关联 矩 阵 T 1 0 0 
drx 试题 考查 考查 知识 点 K 的 情况 
es 学 生 5, 在 试题 7 的 错误 率 T, 0 1 0 
Ar 学 生 5, 在 试题 ,的 失 分 率 表 4 知识 点 推荐 指数 数据 
Wn 知识 点 n 的 综合 权重 Table 4 Recommendation result matrix 
Recs,x, 系统 为 % 推荐 知识 点 天 的 指数 知识 点 推荐 程度 
在 知识 点 推荐 问题 中 ， 有 UU 个 学 生 S={S1，S2，…，Sw} 参 Ki K Ks 
加 某 课程 V 道 试题 ={7， 交 ，…，7} 的 测试 ， 试 题 7 的 标准 Si 0.723 0.511 0.234 
分 为 gn， 其 中 考查 了 N 个 知识 点 K={K1，K2，…，Kw},，U 个 Ss 0.152 0.415 0.267 
学 生 的 习题 得 分 矩阵 G=[gsuwrv]vxr; 其 中 ,gswm=a(0 三 a 三 =gny,gry 
表示 该 试题 7 的 标准 分 ) 表 示 学 生 5 在 试题 7 的 得 分 为 a。 试 Ss, 0.347 0.871 0.454 
题 知识 点 关联 和 矩 阵 0=[grvgn]Jvxw， 其 中 ，gqrvk=0 表示 试题 v 没 c) 输 出 推荐 列表 。 根 据 学 生 知识 点 掌握 程度 ， 获 得 学 生 知 
有 考查 知识 点 n, qnvw=1 表示 试题 7 ,考查 知识 点 Ka。 由 此 , 通 。 识 点 当前 的 知识 漏洞 ， 并 根据 知识 点 薄弱 程度 (推荐 指数 
过 学 生成 绩 得 分 gswmr 及 试题 知识 点 关系 qrvkn 提取 学 生 5 在 知 ”Recsur) 进 行 排序 , 向 每 个 学 生 进 行 top-N 个 性 化 知识 点 推荐 。 
识 点 入 上 的 失 分 率 (loss rate, 1sukn), 错 误 率 (error rate, esukn) 以 及 
该 知识 点 的 综合 权重 (comprehensive weight, wn)， 构 建 知识 点 推 2 知识 点 掌握 概率 模型 
荐 模型 为 学 生 进行 知识 点 推荐 ， 以 期 望 帮助 学 生 更 加 准确 地 了 在 个 性 化 学 习 推荐 系统 中 ， 学 生 知识 点 掌握 概率 模型 的 构 
解 自己 的 知识 漏洞 ， 及 时 弥补 。 文 中 涉及 符号 及 相关 描述 如 表 ” 建 是 重点 。 学 生 知识 点 掌握 概率 反映 了 学 生 对 知识 点 的 掌握 情 
1 所 示 。 况 。 主 要 目的 是 根据 学 生 需 要 ， 识 别 出 该 科目 知 
基于 多 要 素 的 个 性 化 知识 点 推荐 算法 基本 思路 主要 由 数据 识 点 的 考核 要 点 及 学 生 错误 多 的 知识 点 和 丢 分 多 的 知识 点 ， 
输入 ,多 要 素 获 取 和 输出 推荐 列表 三 个 部 分 组 成 ,如 图 1 所 示 为 其 推荐 一 定 知识 相关 的 学 习 内 容 。 其 中 的 主要 策略 是 根据 
每 个 部 分 的 内 容 如 下 : 0 识 点 的 综合 权重 、 错 误 率 、 失 分 率 三 个 重要 影响 因素 构建 学 
a) 数据 输入 。 通 过 对 学 生成 绩 、 试 题 信 息 进行 数据 处 理 ， 生 知识 点 掌握 概率 模型 ， 来 获得 学 生 对 知识 点 的 掌握 情况 。 
获得 测试 知识 点 列表 (用 于 标记 试题 ); 并 将 获得 的 学 生 考 试 Torre 教授 提出 的 认 知 诊断 模型 (DINA 模型 ) 505 是 在 获取 
得 分 数据 如 表 2 所 示 ， 以 及 试题 知识 点 关联 数据 如 表 3 所 示 ， 学 生 知 识 点 掌握 程度 中 使 用 最 多 的 。DINA 模型 用 期 望 最 大 似 
将 表 中 数据 分 别 转换 为 习题 得 分 矩阵 G 和 知识 点 试题 得 分 矩阵 然 (expectation maximization,EM)09 估 算 学 生 对 试题 参数 猜测 率 
Q 输入 。 (sl 加) 和 失误 率 (guessing), 然后 用 后 验 概率 获得 学 生 的 答题 情况 
b) 多 要 素 获 取 。 依 据 输 入 数据 获取 学 生 人 在 知识 点 瑟 的 和 知识 点 掌握 情况 03。 但 DINA 模型 得 到 的 知识 点 掌握 情况 只 


背 误 率 (esukn) 、 失 分 率 (1suxn) 及 知 


识 点 的 综合 权重 (w)， 
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太 准 确 ; 此 外 ，DINA 模型 求解 过 程 中 知识 点 不 能 过 多 ， 否 则 ”所 知识 点 K1， 不 会 向 学 生 Si 推荐 知识 点 K1。 而 本 文 提 出 的 模 
时 间 复 杂 度 很 高 。 本 文 针 对 DINA 模型 存在 的 缺陷 ， 提 出 一 种 ”型 求解 结果 认为 学 生 $1 掌握 还 比较 薄弱 , 在 向 学 生 推荐 的 知识 
基于 多 因素 的 知识 点 掌握 概率 模型 来 求解 学 生 知识 点 的 掌握 情 。 ”点 中 会 出 现 知识 点 Ki。 下 面 对 学 生 知识 点 掌握 概率 模型 中 的 各 
况 。 认 知 诊断 模型 和 学 生 知识 点 掌握 概率 模型 的 对 比如 图 2 所 要 素 进 行 详细 说 明 。 

示 ， 从 图 中 的 (3) 可 以 看 出 学 生 Si 在 认 知 诊断 模型 中 已 经 掌 
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图 1 个 性 化 知识 点 推荐 算法 的 基本 思路 


Fig.l Overview of the framework 


本 二 站 会 有 细微 的 调整 ， 调 整 部 分 会 通过 学 校 测 试 反映 出 来 。 所 以 ， 
S 50.7 | | ube S10.1 分 析 知 识 点 的 测试 权重 也 非常 关键 。 
SS 二 ,二 .se 省 Ld | 
人 Ei ee 
(1 学 生成 续 得 分 拒 阵 G (8 以 知 芝 握 二 元 值 w, ,= 一 学 ,WE[0,H] (1) 
ch 一 n Vv n n 
K, K, .. K, 知识 点 掌握 概率 模型 RE 2 2 8rqrx, 
到 二 | 人 S 054 078 .. 092 gh 
B00 .1 S，023 050 .. 0.67 
0 w, =a*his_w,'+b*test_w," 
ke 了， S。 0.88 049 ... 0.74 w, = 0(test _w,'=0) 2) 
(2 试题 知识 点 拭 阵 Q (4) 知 识 点 掌握 概率 连续 值 | 
本 文通 过 分 析 习 题 7 考核 知识 点 Ki 的 情况 ， 获 得 知识 点 
图 2 认 知 诊断 模型 和 学 生 知识 点 掌握 概率 模型 权重 ww ”， 知 识 点 权重 w ”计算 公式 如 式 (1) 所 示 ，gi 表示 试 
Fig.2 Cognitive diagnosis model versus the proposed model 题 i 的 标准 分 数 ，gnxi 表示 试题 i 考查 考查 知识 点 j 的 情况 ， 权 
2.1 综合 权重 重 的 取 值 范围 为 [0,1]。 根 据 式 (1)， 通 过 分 析 多 年 高 考 真题 中 知 


知识 点 在 考试 查考 过 程 中 有 一 定 的 规律 ， 用 知识 点 的 综合 。 识 点 考核 情况 ， 计 算出 在 高 考 真 题 中 知识 点 n 的 历史 权重 
权重 表示 。 综 合 权 重 表示 知识 点 在 考试 中 的 重要 程度 ， 是 知识 。 ”his_wn ”, 通过 分 析 多 次 测试 中 知识 点 考核 情况 , 计算 出 相应 知 
点 在 多 次 考试 中 考核 总 分 与 多 次 试卷 总 分 的 比 。 某 知识 点 的 权 ” 识 点 的 测试 权重 test_wn”。 
重 越 高 ， 说 明 该 知识 点 越 重 要 ， 是 考试 要 点 ， 值 得 被 推荐 。 为 综合 权重 ww 的 计算 如 式 (2) 所 示 。 因 考试 出 题 大 多 数 参 考 
了 保证 综合 权重 的 合理 性 ， 在 个 性 化 学 习 推荐 系统 中 ， 综 合 考 。” 历史 真题 ， 并 根据 最 新 的 考纲 进行 部 分 调整 ， 在 日 常 测试 中 体 
虑 知识 点 的 历史 考核 权重 及 测试 考核 权重 两 个 方面 。 历 史 考 核 ” 现 出 来 。 因 此 ， 综 合 权 重 涉及 历史 权重 与 测试 权重 两 部 分 ， 
权重 为 知识 点 在 最 近 五 年 高 考 真题 中 的 考核 权重 。 万 变 不 离 其 设置 影响 因子 a, 5 的 比重 进行 线性 相关 , 并 通过 分 析 5 年 高 考 
宗 ， 真 题 从 一 定 程度 上 反映 了 知识 点 的 分 布 和 考试 的 着 重点 。 真题 和 4 次 测试 试卷 获得 影响 因子 a: 5 约 为 7: 3。 若 多 次 日 
因此 ， 分 析 知 识 点 的 历史 权重 至 关 重 要 。 测 试 权重 为 知识 点 在 。” 常 测试 的 知识 考核 权重 为 0， 表 示 该 知识 点 考核 情况 进行 了 调 
学 校 测试 (月 考 、 期 中 考 、 期 末 考 、 模 拟 考 等 ) 中 考核 权重 。 整 ， 在 接 下 来 的 考试 中 将 不 再 进行 考核 ， 则 综合 权重 为 0。 综 
教育 不 断 发 展 , 考试 也 日 渐 合 理 规范 ,新 一 年 的 考试 对 比 往年 ， 合 权重 的 取 值 范围 为 [0,1]。 综 合 权重 越 高 ， 说 明 该 知识 点 越 重 要 。 


TI 
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2.2 ”错误 率 
普 误 率 表示 学 生 在 多 次 考试 中 某 知 识 点 错误 次 数 与 该 知识 
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点 考核 次 数 的 比 。 在 个 性 化 学 习 推 荐 系统 中 ， 某 知识 点 未 获得 


试题 标准 分 即 认 定 其 错误 。 某 知识 点 错误 次 数 越 多 ， 说 明 该 知 
识 点 是 当前 学 生 需 要 加 强 的 点 ， 也 越 值得 被 推荐 。 


Ss G) 


0, p(gr qrx, * Bsr qrx,) 
Pr = 
1， plgr qrx, 二 gsnqdrx,) 


其 中 :esuxkn 表示 学 生 Su 在 知识 点 Kn 上 的 错误 率 ， 为 学 生 Su 在 知 
识 点 Kn 错误 次 数 与 知识 点 考核 次 数 的 比 ， 错 误 率 esuxr 的 取 值 


指数 由 高 到 低 对 知识 点 进行 排序 。 推 荐 指数 高 的 ， 优 先 推荐 。 
根据 学 生 将 对 推荐 结果 进行 反馈 ， 本 文 对 推荐 模型 的 推荐 数量 
进行 调整 ， 力 求 推 荐 知识 点 更 加 合理 。 
Recs x, = f (WwW, sg,» ls,x, ), 
fe 
Recs gr l=%W, 一 一 ee 
a G) 
Recs ,2= 本 Et 


Recs x, 3 WEs, Kk, sx, y 


3 ”系统 开发 、 应 用 及 实验 测评 
3.1 数据 集 

为 了 验证 学 生 知识 点 概率 模型 的 有 效 性 , 本 文 在 Dataset 数 
据 集 ， 实 验 数 据 集 如 表 5 所 示 。Dataset 数据 集 是 湘潭 县 一 中 高 


范围 为 [0,1]。 通 过 从 学 生 测试 成 绩 及 试题 知识 点 关联 关系 获得 
学 生 在 知识 点 K 上 的 错误 次 数 及 知识 点 考核 的 总 次 数 求 得 ,未 
获得 该 试题 满分 的 情况 视 为 该 试题 错误 ， 即 相应 考核 知识 点 错 
误 。 错误 率 的 计算 如 式 (3) 所 示 。 错误 率 esup 越 高 , 说 明 学 生 5 
在 知识 点 K 考查 中 出 错 频率 越 高 。 
2.3” 失 分 率 

失 分 率 表示 学 生 在 多 次 考试 中 某 知识 点 丢失 分 数 与 该 知识 
点 考核 总 分 数 的 比 。 失 分 率 越 高 ， 说 明 学 生 该 知识 点 掌握 越 不 
牢固 ， 越 影响 考试 的 最 终 得 分 。 所 以 ， 学 生 应 该 加 强 该 知识 点 
的 学 习 。 失 分 率 与 错误 率 有 一 定 的 联系 ， 但 非 线 性 相关 。 在 个 
性 化 学 习 推 荐 系统 中 ， 错 误 率 越 高 的 知识 点 失 分 率 越 高 ， 但 因 
主观 题 的 得 分 情况 除 满 分 和 零 分 外 ， 可 部 分 得 分 ， 两 者 非 线性 
相关 ， 所 以 失 分 率 与 错误 率 为 两 个 不 同 的 影响 因素 。 


TT 


[0,1] (4) 


失 分 率 的 计算 如 式 (4) 所 示 。1swi 表示 某 考核 知识 点 的 失 分 
， 其 取 值 范围 为 [0,1] 。 通 过 从 学 生 % 在 试题 7 的 得 分 转换 为 
学 生 5 在 知识 点 Kn 的 得 分 来 计算 , gn 表示 试题 的 标准 分 , gsuri 
表示 学 生 在 试题 7; 的 真实 得 分 ， 其 取 值 范围 为 [0,gri]，grign 表 
示 知 识 点 K 与 试题 7 的 关联 关系 (考查 或 未 考查 ) 。 失 分 率 
lsukn 越 高 ， 说 明 学 生 5 在 考查 知识 点 Ti 过 程 中 于 分 越 多 ， 从 一 
定 程度 上 反映 了 学 生 的 知识 漏洞 。 

2.4 知识 点 掌握 概率 模型 
个 性 化 学 习 推 荐 系统 的 学 生 知 识 点 掌握 概率 模型 ， 综 合 考 


三 学 生 连 续 多 次 在 校 真实 的 数学 考试 成 绩 ， 包 含 1340 名 学 生 ， 
92 个 试题 ，28 个 知识 点 。 其 中 ，1340 名 学 生 在 115 个 具有 试 
题 得 分 构成 习题 得 分 矩阵 G; 由 92 个 试题 和 28 个 知识 点 (各 
知识 点 相互 独立 ) 构成 试题 知识 点 矩阵 Q， 用 1 和 0 表示 试题 
考查 或 未 考查 相应 知识 点 。 将 通过 数据 处 理 后 的 数据 作为 系统 
输入 。 


7 


表 5 Dataset 实验 数据 外 


Table $ Dataset 


项 目 数量 
学 生 数 量 1340 
试题 个 数 92 
知识 点 个 数 28 


3.2 实验 及 评测 

为 了 验证 算法 的 有 效 性 ， 本 文 分 别 采用 认 知 诊断 模型 
(DINA)、 协同 过 滤 (CF) 方 法 、 概 率 和 矩阵 分 解 (PMF) 方 法 和 本 文 提 
出 的 Recsukn 三 种 方案 在 湘潭 县 一 中 数学 测试 集 上 进行 实验 ， 
采用 随机 抽样 对 湘潭 县 一 中 200 名 学 生 展 开 以 上 方案 推荐 的 
Top-8 的 知识 点 列表 准确 度 的 问卷 调查 。 

DINA 方法 根据 DINA 诊断 学 生 知识 掌握 程度 ， 从 推荐 试 
题 集合 中 选取 学 生 掌握 比较 弱 的 知识 点 进行 推荐 ; CF 方法 通过 
学 生 已 经 有 的 试题 得 分 ， 计 算出 学 生 之 间 的 Jaccard 相似 度 找 
到 与 之 答题 情况 最 相似 的 学 生 ， 再 根据 最 相似 学 生 的 得 分 预测 
学 生 的 得 分 ， 再 根据 预测 结果 得 分 的 高 低 进 行 推荐 PMEF 方法 
通过 已 有 试题 得 分 情况 分 解 得 到 学 生 和 试题 的 低 维 潜在 因子 向 
量 ， 预 测 学 生得 分 情况 进行 个 性 化 推荐 &12;，Recsurkn 方法 从 学 
生 答 题 情况 获取 知识 点 综合 权重 ， 错 误 率 和 失 分 率 多 个 重要 因 


虑 考虑 综合 权重 ， 错 误 率 和 失 分 率 多 个 因素 三 个 重要 因素 ， 
根据 这 三 个 因素 的 构建 推荐 指数 Recsukn 来 表示 学 生 知 识 点 掌 
握 概率 ， 如 式 (5) 所 示 。 推 荐 指数 越 高 ， 说 明 该 知识 点 越 值得 被 
E 荐 ,在 实验 过 程 中 ,设计 三 种 方案 Recsukn1, Recsukn2, Recsukn3， 
本 文 运用 以 下 三 种 方案 进行 实验 ， 并 通过 实验 评测 确认 最 终 推 
荐 方案 应 用 于 在 线 推荐 系统 中 。 在 确认 推荐 知识 点 时 ， 本 文 对 
荐 指数 进行 排序 ， 为 学 生 推 荐 其 弱项 知识 点 。 系 统 根据 推荐 


素 构建 知识 点 掌握 概率 模型 ， 根 据 学 生 知识 点 掌握 程度 进行 个 
性 化 推荐 。 


了 TP 
Precision = 一 一 一， 
TP+FP 
Recall = ZE (6) 
TP+FN 


米 1 7 米 
F1=2 Precision* Recall 


Precision+ Recall 


ev 
ULnlInaxIV 世 人 
和 


录用 定稿 匡 容 ， 等 : 基于 多 重 因素 的 个 性 化 学 习 推荐 系统 


本 文 根 据 学 生 和 教师 对 个 性 化 学 习 推 荐 系统 推荐 的 知识 点 17.4%，9.8%，41.4%; Fl 值 分 别提 高 了 15%，8.9%，30.2%。 
结果 的 反馈 ， 用 准确 率 (precision)， 召 回 率 (recal) 和 Fi 指标 及 ”在 本 文 提出 的 三 种 算法 中 Recsukn3 的 推荐 效果 最 佳 ， 准 确 率 达 
运行 时 间 (running time) 来 评价 推荐 效果 ， 各 指标 的 计算 公式 如 ”到 了 91.2%, Fl 值 为 78.4%， 比 DINA 模型 、 PMEF 方法 、CF 方 
式 (6) 所 示 。Precision 为 系统 推荐 知识 点 正确 个 数 与 推荐 推荐 总 。 法 准确 率 分 别提 高 41.4%, 29.5%,35.9%, Fl 高 30.2%,23.7%， 
数 的 比 ，7P 表示 系统 推荐 知识 点 正确 个 数 ，FP 表示 系统 推荐 。 21.8%。 而 且 Recsukn3 复杂 度 较 低 , 运行 时 间 最 短 , 与 传统 DINA 
知识 点 错误 数量 。 准 确 率 越 高 ， 说 明 系 统 为 学 生 推 荐 的 知识 点 。 方法 相 比 快 2.01s。 主 要 原因 在 于 : DINA 模型 反馈 学 生 对 知识 
越 符 合 学 生 的 实际 学 习 情 况 。Recall 为 系统 推荐 知识 点 正确 个 ” 点 的 掌握 情况 只 有 掌握 和 未 掌握 两 种 ， 对 知识 点 的 掌握 情况 不 
数 与 系统 推荐 个 数 和 用 户 反 馈 未 推荐 的 知识 点 总 数 数 的 比 ,FN ”能 进行 概率 化 ， 容 易 造成 数据 丢失 ， 推 荐 效果 欠 佳 , 且 数 据 集 知 
表示 用 户 反馈 系统 未 推荐 的 知识 点 的 数量 。 召 回 率 越 高 说 明 系 。 识 点 个 数 较 多 ,求解 学 生 知 识 点 掌握 情况 的 过 程 时 间 复 杂 度 较 


Th 


统 为 学 生 推荐 的 知识 点 越 全 面 。F 值 是 精确 率 和 召回 率 的 调和 ” ”高 ; CF 方法 根据 相似 学 生 的 共性 进行 推荐 , 忽略 了 学 生 答题 和 
均值 。Running time 是 算法 在 数据 集 上 的 运行 时 间 。 知识 掌握 个 性 化 ， 导 致 推荐 效果 欠 佳 ， PMF 方法 基于 习题 进行 
不 同 推荐 算法 下 推荐 效果 如 表 6 所 示 。 推荐 ， 忽 略 了 学 生 对 知识 点 掌握 情况 的 分 析 ， 导 致 其 推荐 准确 
表 6 不 同 推荐 算法 下 推荐 效果 率 有 待 提 高 ， 而 文中 所 提出 的 基于 多 要 素 的 推荐 方法 ， 更 能 反 
Table 6 Compared with different algorithms 馈 学 生 对 知识 点 的 掌握 情况 ， 推 荐 结果 更 加 贴 合 学 生 实际 学 习 
算法 precision recall Fl running time 需要 。 

DINA 0.498 0.467 0.482 4.47s 娠 此， 选择 Recsukn3 的 推荐 策略 应 用 与 个 性 化 学 习 推 荐 系 
CF 0.553 0.541 0.547 4.18s 统 中 给 学 生 进 行 知识 点 推荐 ， 并 在 实际 应 用 过 程 中 将 推荐 指数 
PMF 0.617 0.522 0.566 3.24s 扩大 一 千 倍 ， 让 用 户 能 够 清楚 地 了 解 每 位 学 生 各 个 知识 点 的 掌 
Recsuknl 0.672 0.596 0.632 2.71s 握 程度 的 差距 ， 并 激发 学 生发 挥 主观 能 动 性 ， 加 强 学 习 ， 提 高 

Recsukn2 0.596 0.548 0.571 2.60s 考试 表现 。 
Recsurn3 0.912 0.688 0.784 2.46s 在 实验 评估 过 程 中 ， 因 学 生 未 意识 到 自己 的 弱项 知识 点 或 


从 表 中 数据 对 比 可 以 看 出 ， 本 文 提 出 的 基于 多 因素 的 个 性 ”者 对 知识 体系 不 熟悉 ， 可 能 反馈 的 未 推荐 知识 点 不 全 面 ， 导 致 
化 知识 点 推荐 算法 Recsukn 相对 传统 的 DINA 模型 、CF 方法 召回 率 不 太 准 确 。 但 从 实验 评估 的 整体 考虑 ， 学 生 对 所 有 知识 
有 较 好 的 效果 。Recsukn1，Recsukn2，Recsukn3 算法 的 推荐 效果 ”点 的 反馈 均 具 有 此 特点 ， 所 以 召回 率 的 评估 从 一 定 程度 上 能 说 
相对 传统 的 DINA 模型 最 为 明显 ， 准 确 率 分 别提 高 了 达到 了 明 以 上 情况 。 
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个 人 信息 管理 


学 生 模 块 个 人 成 绩 查询 


学 生成 绩 查询 知识 点 


教师 模块 
学 生 知识 点 推荐 查询 


试题 信息 录入 


成 绩 信 息 录 入 


账号 管理 
| 教师 模块 功能 


图 3 系统 功能 模块 图 
Fig.3 Relation matrix of questions and knowledge points 

3.3 ”系统 快照 采用 Python 语言 进行 编写 的 ， 系 统 使 用 RazorSQL 进行 数据 

个 性 化 推荐 系统 是 在 Linux0 "环境 下 用 DB2 作为 数据 库 ， ” 库 查 询 、SQL 的 编辑 、 数据 库 管 理 ; 同时 采用 Xshell 关联 , Xftp 
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定稿 匡 容 ， 等 : 基于 多 重 


传输 文件 的 方法 ， 快 速 地 对 服务 器 进行 上 传 、 下 载 文 件 。 


表 7 学 生 “ 丁 昱 夫 ” 反 馈 信息 统计 表 
Table7 Feedback from a student “Ding Yufu” 


推荐 编号 1 2 


4 3 6 7 


Oo 


正确 /错误 


3 
V x V 
充 个 数 7 7 


V V V 


6 5 4 3 2 1 


8 学 生 


“ 丁 昱 夫 ” 推 荐 效果 评测 表 


Table 8 ”Performance example of “Ding Yufu” 


推荐 人 数 1 2 3 


4 5 6 7 8 


准确 率 1 
召回 率 
Fl 


0.5 0.667 0.75 0.8 0.833 0.857 0.875 


0.143 0.111 0.222 0.333 0.444 0.556 0.667 0.889 
0.250 0.182 0.333 0.461 0.571 0.667 0.750 0.882 


个 性 化 学 习 推荐 系统 基于 学 生日 常 在 校 考 试 的 真实 数据 ， 


为 | 


验 ， 


系统 管理 员 ) 的 不 同 设计 不 同 的 功能 ， 系 统 功能 模块 图 


户 提供 个 性 化 知识 点 推荐 的 浏览 和 学 习 服 务 ， 增 强 用 户 体 
提高 网 站 的 粘性 。 在 系统 中 , 根据 用 户 角 色 (学 生 、 教 师 、 
如 图 3 


t 


所 示 。 除 了 为 用 


户 推荐 知识 点 尹 9 本 文 还 实现 了 信息 管理 ， 成 


绩 查询 ， 数 据 导 入 等 功能 ， 个 性 化 学 习 推荐 系统 快照 如 图 4~7 
所 示 。 


了 生 且 确 mA 加 ms 和 © 学 生 砚 绩 @ 

> ret 坛 浊 枫叶 班 最 

> wr 叶 入 
再 绩 绩 号 。 底 溢 坊 号 更 级 姓名。 查分 
G0010001 testl 1524 际 强 122 62 60 Sle] 
G0010002 test1 1524 Kym 116 61 55 StB) 
G0010003 test1 1524 sgl 124 74 50 se] 
G0010004 test1 1524 何 两 吨 6 | 
G0010005 testl 1524 何 IE 64 45 Sle] 
G0010006 testl 1524 胡 六 以 99 59 40 SB 
G0010007 test1 1524 再 中 125 65 60 5[B) 
G0010008 test1 1524 赐 114 64 50 5LB] 
G0010009 test1 1524 jl 。 127 72 55 SIB] 
GO010010 testT 1524 /WE 答 144 84 60 5IB] 
G0010011 testl 1524 什 欣 表 131 71 60 slel 
Go010012 test1 1524 EM 126 71 55 Ste] 
G0010013 test1 1524 /EWKE 117 62 55 SB 
G0010014 test1 1524 地 pk 中 133 73 60 Sle] 
G0010015 test1 1524 刘 生 地 107 5: 55 Sle) 
G0010016 test1 1524 刘 南 干 104 49 Se] 
G0010017 test1 1524 WW 105 50 55 SB 
G0010018 test1 1524 刘 之 岳 101 46 Sle] 


因素 的 个 性 化 学 习 推荐 系统 
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SIA} 
SIA] 
SIA) 
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从 图 7 中 可 以 看 到 ， 系 统 为 学 生 “ 丁 垦 夫 ” 进 行 top-8 知 


识 点 


晰 明了 地 知道 


荐 的 知识 点 


其 
系统 


据 大 部 分 学 4 


据 : 


E 荐 的 结果 ， 


E 荐 的 准确 率 和 召 
# 荐 第 2 个 知识 点 为 选 做 题 ， 并 非 不 会 作答 ， 
做 试题 的 相应 知识 点 错误 率 和 失 分 率 很 高 ， 容 易 导致 此 处 失 
结果 不 准确 .但 系统 推荐 准确 度 从 第 三 个 知识 点 开始 不 | 


WT 


E 荐 第 8 个 时 ， 反 馈 


\。 随 着 推荐 知识 


| 


E 荐 知识 点 根据 推荐 指数 排序 ， 使 学 生 能 清 
自己 各 个 知识 点 的 掌握 程度 。 学 生 “ 了 丁 昱 夫 ” 对 
E 荐 结果 的 反馈 如 表 7 所 示 ， 从 该 学 生 的 反馈 本 文 可 知 系统 推 
荐 的 第 2 个 知识 点 非 耳 昱 夫 的 弱项 知识 点 ， 其 他 知识 点 均 推 荐 
正确 。“ 丁 昱 夫 ” 在 系统 推荐 1 个 知识 点 时 ， 列 出 了 7 个 未 推 
点 增多 ,学 生 补充 知识 点 逐渐 渐 少 。 
补充 1 个 知识 点 。 由 此 分 析 获 得 系统 为 


率 及 Fl1 指标 如 表 8 所 示 ， 因 学 生 反 馈 


丽 
本 满足 需求 ， 


充 系统 未 给 
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反馈 推荐 知识 点 均 为 自己 的 知识 漏洞 ， 
荐 指数 进行 知识 点 的 加 强 复习 ， 能 帮助 学 生 有 计划 地 进行 
固 学 习 。 随 着 系统 推荐 知识 点 增多 


导致 该 未 选 


并 根 


时 ， 学 生 认 为 系统 推荐 基 


且 因 部 分 知识 点 遗忘 或 记忆 不 清楚 ， 所 以 未 再 补 
荐 的 知识 点 弱点 。 
考虑 “ 题 型 ”因素 改进 推荐 模型 。 
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此 ， 后 期 完善 ， 本 文 可 


| mmr odmin > | 


I 


Ci 要 条 


SI[B] 
5IB) 
SIB) 
SIB) 
SIB} 
SIB} 
5B} 
SB] 
SIB] 
5IB) 
SI] 
S[B] 
se] 
51B) 


S[B] 
S[B) 
S[B) 
5[B] 
5[B) 
SB] 
5[B) 
S[B} 
S[B] 
SIB) 
S[B] 
S[B} 
5[B) 
SBl 


主观 短 ” 容 观 旺 ST002001 ST002002 ST002003 ST002004 ST002005 ST002006 ST002007 ST002008 ST002009 ST00 


个 性 佬 学 习 推 荐 系 往 
》 闻 生成 缚 we 入 © 学 生成 线 加 推荐 JDiRA @ 
v MR 班级 姓 种 
> 到 操守 入 
姓名 班级 知识 点 
丁 田 夫 1523 导数 与 的 数 1 
丁 畦 夫 1523 不 赃 式 选 讲 1 ( 选 做 ) 
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丁 轩 夫 1523 er 
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丁 罗 洁 1521 不 蛙 式 造 放 1 《 选 做 ) 
丁克 洁 1521 Ec)ll 
了 丁 罗 沾 1521 解析 几何 1 
本 梦 洁 1521 坐标 系 与 参 哮 方程 1 ( 选 做 ) 
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图 6 数据 导入 


Fig.6 Data import 


学 生成 顷 @ 数据 导入 四 推荐 知识 点 四 


级 姓名 本 时 夫 推荐 数量 8 
本 旦 夫 1523 SS 3 
本 旦 夫 1523 不 村 二 让 #1 ( 选 收 ) 2 
了 丁 曼 夫 1523 解析 几何 1 : 
了 至 夫 1523 。。。 举 标 系 与 参数 方程 1 ( 选 做 ) 3 
EE 1523 导数 1 
丁 旦 夫 1523 线性 规划 3 
本 时 夫 1523 数列 1 2 
了 要 夫 1523 三 1 


收 起 
测试 权重 
0.033 

0.033 0033 

0.027 0017 

0033 0.033 

0.053 0.058 

0033 0033 

0.027 0.025 

006 0033 

0.053 0.075 

0.033 0033 
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0.033 0033 

0033 0.008 

0.007 0017 

002 0.033 

0.007 0 

0.007 0.008 
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考核 次 数 失 分 总 数 失 分 率 推荐 指数 
3 32 0.89 71.2 
2 20 1 67 
3 31 0.86 55.04 
3 15 0.5 335 
1 5 1 33 
3 15 1 33 
2 11 0.46 29.44 
1 5 27 


图 7 知识 点 推荐 结果 


Fig.7 Predicted results 


4 ”结束 语 


个 性 化 学 习 推 荐 系统 是 针对 普通 中 学 生 用 户 群 的 学 习 教 辅 
系统 ， 运 用 知识 点 综合 权重 和 学 生 在 相应 知识 点 上 的 错误 率 、 
失 分 率 多 重 因 素 ， 构 建 了 多 个 学 生 知识 点 掌握 概率 模型 ， 并 与 
DINA 方法 、CF 方法 、PMEF 方法 进行 大 量 的 对 比 实验 ,通过 湘 
潭 县 一 中 学 生 实际 应 用 评价 ， 选 择 表现 最 佳 的 模型 Recsukn3 应 
用 到 系统 中 ， 系 统 默 认 推荐 为 TOP-8 的 知识 点 ， 实 验 评估 准确 
率 达 到 91.2%，F1l 达到 了 78.4%， 比 DINA 方法 、CF 方法 、 
PMF 方法 准确 率 分 别 高 41.4%，29.5%，35.9%， 显 示 了 提出 策 
略 的 有 效 性 和 可 靠 性 。 在 一 定 程度 上 ， 系 统 能 帮助 中 高 级 中 学 
坚决 学 校 教 辅 系统 不 完善 ， 教 师 一 对 一 交流 时 间 不 够 ， 学 生 分 
析 问 题 能 力 不 足 等 问题 ,明确 学 生 知识 漏洞 ,发 挥 主观 能 动 性 ， 
开展 有 针对 性 地 进行 加 强 学 习 。 

为 了 进一步 完善 个 性 化 学 习 推 荐 系统 的 设计 与 开发 ， 将 从 
以 下 两 点 进行 完善 : g) 构 建 课程 知识 题库 ， 为 学 习 者 筛选 出 合 
适 的 知识 资源 ;b) 自 动 匹 配 试题 与 知识 点 ， 节 约 知 识 点 与 试题 绑 


本 了 


定 的 时 间 成 本 。 在 后 续 研 究 中 ， 将 把 个 性 化 推荐 系统 的 完善 版 


下 


E 式 应 用 于 普通 中 学 进行 教学 


Hp 


可 。 
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